Китайская Moore Threads представила ИИ-ускоритель MTT S4000 — он до 15 раз медленнее NVIDIA H100
Китайский производитель Moore Threads сделал ставку на создание инфраструктуры для больших языковых моделей (LLM), анонсировав ускоритель MTT S4000. В отличие от западных гигантов, ориентированных на универсальные дата-центры, новинка нацелена на решение конкретной задачи: преодоление дефицита вычислительных мощностей для ИИ в условиях технологических ограничений. Первая партия из тысячи карт пойдет на строительство крупнейшего в КНР специализированного кластера, что может изменить расстановку сил на рынке.
Архитектура и цифры: сравнение с конкурентами
В основе MTT S4000 лежит фирменный графический процессор на архитектуре MUSA третьего поколения. Ускоритель выполнен в формате карты PCIe и оснащен 48 Гбайт памяти GDDR6 с пропускной способностью 768 Гбайт/с. Ключевая техническая особенность — поддержка интерфейса PCIe 5.0, что делает Moore Threads единственным производителем, применяющим этот стандарт в своих видеокартах на данный момент.
Заявленная производительность составляет 200 TOPS в операциях INT8 и 25 Тфлопс в FP32. Это в пять раз превосходит показатели нейропроцессоров (NPU) в новейших процессорах AMD Ryzen 8040 и Intel Core Ultra. Однако прямое сравнение с флагманскими решениями NVIDIA H100 показывает серьезный разрыв: по данным производителя, H100 достигает 3026 TOPS в INT8 и 756 Тфлопс в TF32. Тем не менее, MTT S4000 может стать альтернативой для задач, не требующих предельной производительности, особенно в сегменте средних и малых предприятий.
Нестандартное оснащение и программная совместимость
Отличительной чертой MTT S4000 является наличие четырех внешних видеоразъемов, поддерживающих разрешение до 8K. Обычно ускорители такого класса лишены подобных интерфейсов. Это позволяет использовать карту не только в серверных стойках, но и в рабочих станциях для рендеринга или работы с видео высокого разрешения. Устройство поддерживает до 96 видеопотоков в 1080p.
Критически важным фактором является программная совместимость. Moore Threads заявляет о поддержке инструментария USIFY, который позволяет запускать код, написанный для экосистемы NVIDIA CUDA. Это снижает барьер входа для разработчиков, привыкших к западному софту, и ускоряет внедрение MTT S4000 в существующие проекты.
Платформа KUAE и масштабирование
Moore Threads предлагает MTT S4000 не как отдельный продукт, а в составе серверных систем KUAE. Один сервер KUAE MCCX D800 вмещает восемь ускорителей, а несколько таких серверов объединяются в кластеры через интерфейс MTLink 1.0. Платформа поддерживает все современные большие языковые модели, включая Llama, GPT, Bloom, GLM, Baichuan и Yuyan, и способна обрабатывать модели с объемом до 130 миллиардов параметров.
Создание первого крупномасштабного ИИ-кластера на базе тысячи MTT S4000 станет проверкой технологии в реальных условиях. Успех этого проекта может стимулировать спрос на китайские ускорители как внутри страны, так и на дружественных рынках, где доступ к американским чипам ограничен.
О стоимости MTT S4000 не сообщается. Однако, учитывая, что Moore Threads позиционирует свои решения как ответ на санкционные ограничения, можно предположить, что цена будет ниже, чем у аналогов NVIDIA, при условии сопоставимой производительности в конкретных задачах. Первые поставки ускорителей уже начаты, и кластер должен заработать в ближайшие кварталы.















